gusucode.com > 同济大学研究生数模竞赛2015年 A题 > 同济大学研究生数模竞赛2015年 A题.txt

    大数据是一个新兴的概念,其基本特征是数据量巨大、价值密度低、来源广泛、特征多样。教育数据挖掘是建立数学和统计学模型利用学生的入学、在校成绩、毕业和其它记录等信息来分析学生的表现情况、评分等级、学生分类和职业生涯规划等,来帮助学生更好的规划学习生活。近年来,教育信息处理技术发展十分迅速,不再局限于教育统计学,教育数据挖掘成为一门新兴学科。 

澳大利亚学者利用统计方法分析了29所大学的2196名学生在网络学习平台的经验和喜好并且发现一个特别重要的关于对学生对他们学习成绩的看法的结果:当某个人的知识应用在实际或技能上的概念知识能够被学生获取时,学生喜欢面对面学习;然而,当在自我调节学习的技能将被他们学到时,学生提倡网上学习。纽约市教育部门累计了包括 110 万学生信息的110TB 的庞大数据仓库,在这个基础上建立了称之为 PLANO 的计划,在其中 8 所学校中通过数据挖掘发现了60 名处于可能在标准测试中不合格的学生,然后教师们制定针对性的计划帮助他们,最终只有 10名学生在最终的测试中表现不佳,取得了巨大成功。 

附件提供了某高校学生入学、在校成绩、毕业和其它记录,以及一卡通消费和图书馆的使用记录,试建立数学模型进行数据挖掘分析: 

试根据行为轨迹和学习成绩等对学生进行分类,并尽可能刻画每一类人群具有更多的共同的行为特征。 
试建立数学模型评价学生行为轨迹和学习成绩之间的关系; 他们的生活表现和就业有什么关系? 
创新能力的培养和下面的那些环节或者个人行为习惯相关?说明你的理由。 
创新能力指标设定; 
出入寝室楼/图书馆的频率; 
就餐规律,作息规律; 
选课、成绩及科研成果 
从中你能得到创新能力优秀的学生一般具有什么特点? 
那些学籍上异动的学生,如离校或者退学,他们具有什么样的特征,是否存在有效的预警机制? 
请给广大的研究生朋友另写一个1-2页的非技术性报告,介绍你们的发现。